造神型的數據分析:解析政府真的降低「兒虐」人數?
造神型的數據分析:解析政府真的降低「兒虐」人數?
2019.01.28 | 生活

最近虐童案頻傳,部分網友紛紛跳出來罵說:政府真是沒有用,虐嬰比例上升!但這時候某媒體 【圖表】近十年施虐者「樣貌」:兒虐案的主因不只是「小爸媽」 (此文已修正,包含將 2018年的數據移除,以及把「家外」的人數加入)一文中的一張圖出來打了很多人的臉。

從未經調整的原圖來看,政府真的是無限威能,上任隔年開始兒虐案受虐人數瞬間砍半,從每年超過萬人以上,瞬間砍半到不 5,000 ,這實在太神奇了

但是身為一個視數據分析為主要技能的我,看到這種砍半數據只有一個直覺:不可能!對不起,我就是要說:不可能!

任何有點基礎數據分析能力的人都會知道數據大漲或大跌,其背後一定要有原因,而不是看到數據下跌了就說棒棒噠。

可是翻開過去兩年,政府對於兒少受虐,從小燈泡開始嚴格來說沒有太大的積極作為,也就是沒有任何的外力或條件可以減少兒少受虐人數,難道真的是經濟變好,虐待小孩的父母良心發現,所以不再虐兒了?

所以身為一個數據分析者,第一件事情,就要先回頭看還沒被做成圖表原始數據。

數據有問題通常第一件事情都是原始資料就出了錯。

因此我們打開了衛福部統計處的網頁,裡面的資料分類做得相當的好,包含人數、類型都分類的清清楚楚的,但當我下載了 3.5.6 的「 兒童少年保護 - 受虐人數 」時,第一個問題就出現了:

數據統計方式明顯出現了改變

兒童少年保護-受虐人數_造神型的數據分析.jpg
圖/ 衛福部統計處

從 106 年起,除了時間維度之外,分類的維度從「兒童少年保護 - 受虐人數 Number of Abused Child and Youth」改為了「家內兒童及少年保護案件 - 受虐人數 Intra - family Child and Youth Protection Cases - Number of Abused」(政府還很貼心地加上了紅字,明確的告訴你統計維度的不同。)

統計維度的不同,做成同一張表,自然數據就會有明顯落差,就像如果你看 Google Analytics ,看進站的使用者跟工作階段,擺明就是不同的維度,做在同一張表會是正確的嗎?

數據維度改變的探究

那維度做了什麼改變,能讓破萬掉到不到五千呢? 基本上我是沒有明確地找到相關的說明是如何改變的,但是從 3.5.5 兒童少年保護-受虐類型的分類中找到了原因。

2016年以前的數據應是以「複選」的錯誤統計方式來統計,而 2017 年後應該是以「案件」作為主要類別來做統計。

為什麼這樣的統計方式可能會是錯的?當然受虐方式有很多,假設今天有一個虐兒,他主要是受到身體虐待,但他可能同時也受到了精神虐待甚至性虐待,在複選的情況下就被勾了三次,也就是說同一個虐兒可能被統計兩次以上。(雖然新的表中文「複選」拿掉了,但英文還在)。

這樣也正說明在 2017 年以後,統計回歸以「案件」方式來統計數據砍半的原因,真要說蔡政府作出了什麼貢獻,主要就是讓數據合理化(更正:有朋友指出,馬政府年代就已經做出更正了,不過目前無直接證據先保留)。

但現在也沒有舊有的數據去還原原本 93年至105年錯誤的計算方式正確後的結果,所以無從比較歷史以來蔡政府是不是真的降低了虐童數。

還有麻煩「人次」跟「人數」是不一樣的指標請不要混用。

上半段感謝該媒體修正,但預留一手的查證則要繼續討論了。當然就該媒體代表回應:

「感謝指正,確認2017年至2018的統計數字僅含「家內」人數,故圖表不再列入近兩年統計。

唯「歷年兒虐案受虐人數」一圖,進一步求證衛福部保護司2017年「家內」人數為4135,「家外」為3212,故該年度總人數應為7347人,該圖也已經更正,2018年因沒有完整年度人數故不列入比較。在此也對原本數字誤植導致圖表的錯誤致歉。」

如果我們再打開 3.5.1 兒童少年保護 - 通報處理情形 的檔案就有發現這句話:

兒童少年保護-通報處理情形_造神型的數據分析.jpg
圖/ 衛福部統計處

也就是說 3.5.6 中的人數並非真正受虐人數,而是「有開案的人數」。那時既有開案前的通報案例的數字又是發生了什麼變化呢?

網上盛傳的圖表是成案數,未說明106年是只計家內通報開案、107年只算了前三季。報表看起來才會在現任政府任內看起來特別低,不表示真的低那麼多。

另外只計家內人數也不是為了隱匿情況,而是過去數字有重覆計算人次的問題,而做出調整,還原貼近真實數字 (但也喪失了相同標準數字比較之可能性)。

爬資料可發現,通報數從2010年守護幼苗專案開始逐年攀高,但成案數除了前三年因通報而增加,接下來却是連年下降。

先給大家一個數感,台灣去年的新生兒人數不足20萬人,而去年通報了有近6萬次的兒虐。

一般媒體及兒少團體會報導說是吃案、證據不足而無法成案,但也有檢討說是為了追求通報數而浮報、濫報,造成社工困擾,所以希望改善方法是降低通報數。

本文由邱煜庭授權轉載自其Facebook

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

關鍵字: #數據分析
往下滑看下一篇文章
AI 智慧代理人時代來臨!三大導入階段, AI 落地企業不卡關
AI 智慧代理人時代來臨!三大導入階段, AI 落地企業不卡關

生成式 AI 帶動企業數位轉型浪潮持續升溫,各界不再滿足單一任務型的 AI 應用,而是期盼 AI 能真正成為具備主動決策與多工能力的「智慧代理人」(Agentic AI),在最少人為干預的情況下,自主推進工作流程、完成複雜任務。

但企業導入AI並非一蹴可幾,而是需要對AI有正確認識,並制訂循序漸進的導入流程,才能真正發揮AI功效。在2025台灣人工智慧年會中,cacaFly 聖洋科技技術副總吳振和提出三大導入關鍵階段,深入剖析企業如何從概念驗證(PoC)階段,逐步推進到實際上線(Production),並分享實務經驗與觀察。

延伸閱讀:生成式AI可以怎麼用?cacaFly現身說法,助企業應用GCP服務智慧轉型

解鎖 Agentic AI,企業邁向多任務智慧代理

「很多公司會問,One AI 要做什麼事?但實際上,若要讓 AI 回答公司內部政策或新法條的相關問題,僅靠基礎模型並不足夠。」吳振和指出,要讓 AI 真正成為能「做事」的智慧代理人,前提是它必須理解企業內部的脈絡與知識,並即時掌握外部變動的資訊。

企業必須先釐清內部規範是否與最新法規相符,這意味著系統必須具備持續爬取與解析最新資料的能力。為此,企業必須先截取與整理內容,再建構成專屬的知識庫(Knowledge Base),確保資料品質達到可用標準後,再透過檢索增強生成(Retrieval-Augmented Generation, RAG)技術,使 AI 能夠即時動態查詢並生成符合企業語境的回答。

延伸閱讀:從資料清洗到 RAG,大型語言模型的必需品,做出專屬企業的 AI 知識庫!

吳振和強調,這是一個動態循環的過程:從資料蒐集、品質控管、知識庫建構到生成應用,每一環節都息息相關,任何一處鬆動都會影響最終產出的準確性與可信度。

cacaFly 聖洋科技技術副總吳振和
圖/ cacaFly

破除「一次到位」迷思,從驗證到落地的三大關鍵階段

許多企業對 AI 寄予厚望,因此常將 PoC 視為年度計畫的重點,希望能「一次到位」做出具體成果。但吳振和提醒,若缺乏清楚的系統工程思維,PoC 容易淪為「概念展示」,難以真正走入組織的日常營運。

他將導入 Agentic 系統工程的歷程,分為三個關鍵階段:

1.第一階段:可行性評估(Feasibility Study)
企業必須在投入資源前,先明確界定「最需要被 AI 解決的關鍵問題」是什麼,並進一步設計可量化的驗證指標。這不僅包括評估技術實作的可行性,更要從商業目標出發,釐清導入 AI 的具體使用情境、預期成效與風險邊界,如此才能確保後續模型選型與資料蒐集方向正確對齊業務需求。

2.第二階段:系統設計與驗證(Design & PoC)
在確定導入方向後,必須規劃清楚資料蒐集與整理流程,確保知識庫的內容具備正確性、完整性與時效性。吳振和特別強調,這個階段不能只追求展示效果,而應以「產品化思維」來構築 PoC,使其具備可擴充性、可維護性及安全性,才能為後續上線打下基礎。

3.第三階段:產品化與營運(Production & Operation)
當 PoC 驗證完成後,進入正式上線階段,挑戰也隨之而來。除了需要整合企業內部系統與流程,還必須建立持續監控與維運機制,確保模型表現隨時間演進不會劣化,並能快速回應法規變動或資料更新的需求。吳振和指出,這往往是最容易被低估、但也是最考驗企業組織能力的關鍵環節。

cacaFly 聖洋科技技術副總吳振和
圖/ cacaFly

建立模型優化根基,打造高品質的黃金資料集

吳振和特別強調,要讓 Agentic 系統工程真正發揮效益,企業必須先建立一套高品質的「黃金資料集」(Golden Dataset),作為模型評估與優化根基。他指出,黃金資料集的價值在於能為模型選擇與前測提供客觀依據,讓團隊能針對不同任務挑選最適合的模型,避免導入初期就誤踩方向。

同時,黃金資料集也能協助團隊辨識模型的常見錯誤與脆弱點,進而快速回應「模型飄移」(Model Drift)的風險。吳振和說明,所謂模型飄移,指的是即使模型本身未經改版,效能也可能隨著環境與資料變動而突然下降,導致原本表現良好的模型出現偏差。透過持續比對模型預測與黃金資料集結果,團隊才能即時察覺效能衰退,並進行迭代更新,確保系統長期穩定運作。

從小規模應用起步,漸進擴展至核心業務

吳振和分享,在實際輔導企業導入 AI 的經驗中,最常見的挑戰來自於「期待落差」。許多企業誤認為概念驗證(PoC)階段即可呈現完整的產品原型,然而實際情況顯示,若企業未能建立完善的資料架構與流程基礎設施,即使短期內展現亮眼成效,也難以確保長期營運的穩定性與可持續性。

也因此他建議企業在規劃 AI 導入時,應採取漸進式策略,從小規模應用場景著手,逐步擴展至核心業務領域。企業應將 PoC 定位為整體產品開發生命週期的重要環節,而非獨立的一次性專案。

AI 的導入不僅是一場技術升級,更是企業組織文化與決策流程的轉型工程。唯有從資料治理、流程優化到人才培訓同步布局,才能確保 AI 能在企業內部真正「落地生根」,創造長期商業價值,成為真正的智慧代理人。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓